Optimale Anzahl Komponenten für PCA
- Nur Top 500 Gene miteinbezogen
- 2-3 Komponenten optimal
- Klare Separierbarkeit entlang PC1
- Stabile Kontrollgruppe
- Sora deutlich von DMSO unterschieden
- Tram deutlich heterogener (sollte untersucht werden)
- Problem: Misst nur linearen Zusammenhang
- PC3 erklärt nur knapp 7% der Gesamtvarianz
- Keine bessere Separabilität
t-distributed Stochastic Neighbor Embedding
- Misst lokalen nicht-linearen Zusammenhang
- Deutliche Cluster der drei Treatments
- Trametinib kohärenter als bei PCA
Uniform Manifold Approximation and Projection
- Misst lokalen und globalen Zusammenhang
- “Gradientenstruktur” DMSO → Tram → Sora
- Problem: Zu wenige Samples